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Beschreibung 

Spracherkenner und Betriebsverfahren far einen solchen 

Die Erfindung betrifft einen Spracherkenner nach dem Oberbe- 
griff des Anspruchs 1 sowie ein Betriebsverfahren fur einen 
solchen. 

Nachdem sich die Spracherkennung bei der Texteingabe in auf 
PCs laufenden Btiroapplikationen seit Jahren ein festes und 
stetig wachsendes Anwendungsgebiet gesichert hat, dringt sie 
zunehmend auch in die Steuerung technischer .Gerate ein. So- 
wohl bei hochgradig miniaturisierten und zugleich computeri- 
sierten handgehaltenen elektronischen Geraten - insbesondere 
Mobiltelefonen und PDAs - als auch bei technischen Geraten, 
deren Bedienung moglichst wenig Aufmerksamkeit und Konzentra- 
tion des Bedieners binden sollen - wie der verschiedenen 
technischen Gerate in einem fahrenden Auto - kann diese Art 
der Spracherkennung, mit darauf aufbauender Sprachsteuerung 
sinnvolle EinsatzmOglichkeiten finden. Bei der erstgenannten 
Art von Geraten ist namlich die fur Bedienvorgange verfagbare 
Flache so klein geworden, dafi sich die Vielzahl moglicher 
Funktionen durch herkSmmliche Tastatur- oder TouchScreen- 
Eingaben nur noch sehr unbequem (und far Persbnen mit 
schlechtem SehvermSgen nahezu aberhaupt nicht mehr) realisie- 
ren lafit. Bei Einsatzfeldern, in denen die Aufmerksamkeit des 
Benutzers auf andere Dinge (z. B. den Straiienverkehr) gerich- 
tet blexben muli, erbringt die Einfahrung der Sprachsteuerung 
neben der Komfortsteigerung auch einen wesentlichen Sicher- 
heitszuwachs • 

In der Spracherkennung wird ein Lexikon mit den zu erkennen- 
den W6rtern benotigt. Diese werden im Falle der phonembasier- 
ten Spracherkennung mittels einem Text-to-Phonem-Verfahren in 
eane phonetische Umschrift aberfuhrt und im Vokabular abge- 
legt Wahrend des Erkennungsvorgangs erfolgt im sogenannten 
Vaterbx-Algorithmus eine Suche nach dem besten Pfad durch die 
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im Vokabular enthaltenen Phonemfolgen. Einzelheiten zu den 
etablierten Spracherkennungsalgorithmen finden sich in der 
einschlagigen Fachliteratur . 

Weitgehend computerisierte technische Gerate der oben ange- 
sprochenen Art (PDAs, Handheld-PCs, Mobiltelef one, Kfz-Audio- 
anlagen, Kfz-Bor computer etc.) haben vielfach an PC-Bedien- 
oberflachen angelehnte Strukturen der Benutzerschnittstellen 
bzw MMIs. Es ist eine Mehrzahl von Applikationen instal- 
liert, die auf geeignete Weise - und bei komplexeren Geraten 
auch in einer bestimmten, logischen hierarchischen Unterord- 
nung - angesteuert werden miissen. Bei herkemmlichen Geraten 
dieser Art wird hierzu eine Menusteuerung angeboten, die vom 
Benutzer durch Softkey-Eingaben ausgeftihrt wird. 

Bei der Applikationswahl per Spracheingabe befinden sich im 
Lexikon die Programmnamen der verfugbaren Applikationen. Nach 
der Erkennung eines Namens wird das jeweilige Programm ausge- 
ftihrt bzw. die Applikation gestartet: Dazu mtissen die Prp- 
grammnamen und die Programftipfade in einem geeigneten - Format 
abgespeichert sein. 

Gemafi dem Stand der Technik werden die einzelnen Programmna- 
men mit den entsprechenden Erkennungsresultaten (den Worten 
des Lexikons) fest verdrahtet. Dies kann einerseits in einer 
zusatzlichen Datei festgelegt werden oder andererseits fest 
im Quellcode des Programms definiert sein. Beide Methoden ha- 
ben entscheidende Nachteile, welche im folgenden beschrieben 
werden: 

- Beim Arbeiten mit einer zusatzlichen Datei besteht das Pro- 
blem, dali diese von einem Benutzer einsehbar ist und demzu- 
folge auch verandert werden kann. Auch binare Formate oder 
schreibgeschutzte Dateien bieten keinen wirksamen Schutz vor 
Veranderungen. Dadurch konnen Diskrepanzen zwischen dem ver- 
wendeten Vokabular und der Wortliste bzw. Programmliste ent- 
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stehen. Dies hat auch zur Folge, daft die Applikation mogli- 
cherweise falsch reagiert. 

- Bei der Festlegung der als Steuerbefehle wirkenden sprach- 
lichen Aufierungen im Quellcode kann das Vokabular auf einfa- 
chem Wege nicht weiter geandert werden. Es muftte der 
Quellcode jedes Mai neu Qbersetzt und ausgeliefert werden, 
sobald Anderungen der Progranunnamen auftreten. 

- Der entscheidende Nachteil des bisherigen Vorgehens liegt 
in der fehlenden bzw. unzureichenden Erweiterbarkeit des Sys- 
tems. Bisher ist es dem Benutzer nicht m6glich, seine eigenen 
Kommandos oder Anwendungen in die automatische Spracherken- 
nung mit aufzunehmen - jedenfalls nicht ohne die Gefahr einer 
StSrung der urspriinglich programmierten Konf iguration des 
Spracher kenners . 
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Der Erfindung liegt daher die Aufgabe der Bereitstellung ei- 
nes.verbesserten Spracher kenners .und Verfahrens zum Betrieb 
ernes solchen zugrunde, mit denen dieser zur BerUcksichtigung 
von exgenen Steuerbef ehlen oder Anwendungen des Nutzers fle- 
xxbler konfiguriert werden kann. 

Diese Aufgabe wird in ihrem Vorrichtungsaspekt durch einen 
Spracherkenner mit den Merkmalen des Anspruchs 1 und in ihrem 
Verfahrensaspekt durch ein Betriebsverfahren mit den Merkma- 
len des Anspruchs 6 gelost. 

Die Erfindung schlieftt den grundlegenden Gedanken ein zur 
Sprachsteuerung von Applikationen - bzw. zu einer entspre- 
chenden Handhabung von Dateien - eine mit Links aufgebaute 
BenutzeroberflMche bereitzustellen. Das Organisationsprinzip 
der Lxnks erm6glicht ohne weiteres einen strukturierten Auf- 
ruf von Programmen bzw. Dateien in unterschiedlichen Hierar- 
chxeebenen, ohne daft a priori eine starre Zuordnung definiert 
und programmiert werden muft. aetiniert 
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Die Liste der zu erkennenden Worter (das Lexikon) wird durch 
den Inhalt eines bestimmten Dateiverzeichnisses bestimmt, in 
welchem Links (Verkniipfungen) zu den vorhandenen Programmen 
bzw. Dateien enthalten sind. Der Name des Links gibt das zu 
5 erkennende Wort an, und das Programm bzw. die Datei, auf die 
dieser Link zeigt, gibt die auszufuhrende Aktion an. Bei der 
Umsetzung des Namens sollte darauf geachtet werden, daft nur 
der Teilstring vor dem ersten Punkt als Kommando verwendet 
wird. Beim Start des Erkennerprograrams wird das Vokabular er- 
10 zeugt. So kann flexibel auf Anderungen der Applikations- bzw. 
Dateistruktur reagiert werden. Sobald ein Wort erkannt wird, 
wird der entsprechende Link aktiviert und die gewunschte Ak- 
tion ausgefvihrt. 

15 Vorteile gegeniiber dem bisherigen Verfahren sind in der Fle- 
xibilitat, was Worte und Aktionen betrifft, und der einfachen 
Erstellung und Veranderung eines komplexen Erkennerwortschat- 
zes zu sehen. Das Hinzufugen von neuen kommandos zum bisheri- 
gen Wortschatz kann einfach und in gewohnter Weise durchge- 

20 fuhrt werden. Im Dateiverzeichnis mufl lediglich eine Verknup- 
fung zum gewunschten Programm oder der Datei erstellt werden. 
Unter Windows z. B. ist das Erstellen eins Links einfach uber 
das KontextmenU mSglich. 

25 Damit wird ein weitere Vorteil klar: Da das Filesystem die 

Verwaltung von Kommandos und Aktionen (Name und Ziel der Ver- 
kniipfung) ubernimmt, ist kein zusatzliches Programm zur Ver- 
waltung des Wortschatzes notig. Soil ein Kommando gelSscht 
werden, wird einfach der Link geloscht. 

30 

Da moderne Betriebssysteme auch Links auf Dateien erlauben, 
konnen Dokumente ebenfalls per Sprac'h kommando geoffnet wer- 
den . 

35 In einer bevorzugten Ausftihrung umfafit das Dateiverzeichnis 

eine Mehrzahl von Unterverzeichnissen in mindestens einer un- 
tergeordneten Hierarchieebene, wobei die Verzeichnisnamen ein 



10 



15 



20 



25 



30 



erstes und gegebenenf alls weitere, hierarchisch untergeordne- 
te aktive Teilvokabulare des Spracherkenners bilden. 

Durch die Verwendung von Unterverzeichnissen im Dateiver- 
zeichnis lassen sich auf einfachste Weise strukturierte 
Sprachaufrufe von Progranunen und Dateien erzeugen. So konnen 
z. B. alle Links zu Musikstticken in ein Unterverzeichnis "Mu- 
sik" abgelegt werden. In der ersten Stufe der Erkennung be- 
findet sich das Wort "Musik" im aktiven Vokabular. Wird die- 
ses erkannt, wird das Vokabular gewechselt (z. B. per Langua- 
ge Model), die im Unterverzeichnis "Musik" enthaltenen Links 
stehen nun im aktiven Vokabular. 

insbesondere ist jedem Programm bzw. jeder Datei aus einem 
Unterverzeichnis ein zusammenhangender, mehrgliedriger 
Sprachbefehl zugeordnet, der die Namen der zu dem Programm 
bzw. der Datei fuhrenden Links des Dateiverzeichnisses und - 
Dedes nachgeordneten Unterverzeichnisses umfalit. 

Hit dieser Methode lassen sich in einfachster Weise komplexe- 
Sprachkommandos erstellen und editieren. Vorhandene Verzeich- 
nxsse mit Verknupfungen, wie z. B. das Windows Startmenu 
lassen sich nun einfach per Sprachsteuerung bedienen, da' 
schon alle nStigen Informationen vorhanden sind. 

Dieses Verfahren ist eine Weiterentwicklung von Verknupfungen 
mxt Programmen (Beispiel Windows PC) und den festverdrahteten 
Spracherkennerressourcen. Hierbei wird durch Anlegen eines 
Lxnks automatisch die Erkennerressource erstellt D h da- 
nach kann sofort der Name des Links durch den Erkenner 'verar- 
beitet werden. r 
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Genereil W „„e„ beliebioe Dateien und Program, nachdem sie 
in das spezxelle Ver Z eichnis kopiert warden. per Sprachbefehi 
gestartet werden. Es ist also „.i „ t . elu 

, ikr <^, . ° ega1 ' ob es Slch einen Mu- 

s lktl tel, erne c* + Datei, ein Textdokument Oder um ein Pro- 
gram handelt. Durch das Abspeichern eines Links in den, spe- 
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ziellen Verzeichnis wird die Datei durch das eingestellte De- 
faultprogramm geoffnet. Beispiel: Ein Dokument mit der Endung 
.doc wird automatisch mit dem Programm Word geoffnet (wie 
beim Doppelklick mit der Maus auf die Datei bei einer her- 
kommlichen PC-Eingabe) . 

Die oben erlauterten Aspekte der Erfindung stellen sich so- 
wohl als vorrichtungsaspekt eines Spracherkenners wie auch 
als Aspekte des Betriebsverf ahrens eines solchen dar - zumal 
die Realisierung typischerweise in einer . geeigneten Mischung 
aus Hard- und Sof twarekomponenten erfolgen wird. 

Nachfolgend sind zwei Arten, ein Wort in das Erkennerlexikon 
aufzunehmen, genannt: 

(1) Aufnahme durch einen Programmauf ruf tiber das KontextmenU 
fur die gewunschte Anwendung. Hierbei enthalt das Kontextmenu 
zwei Programmauf ruf e (Add und Remove) . Add fiigt das entspre- 
chende Programm/die Datei hinzu und Remove zeigt die Liste 
der Programme/ Date ien an, welche aktuell durch Sprachwahl 
ausgewahlt werden konnen. 

(2) Kopieren des Link der gewiinschten Anwendung in den spezi- 
ellen Ordner tiber "drag ' n • drop" . Hierbei nrnft,' urn ein Programm 
zu entfernen, in das entsprechende Verzeichnis gewechselt und 
der gewunschte Link durch "Entfernen" aus dem Verzeichnis ge- 
16scht werden. 

Die AusfUhrung der Erfindung ist nicht auf die oben beschrie- 
benen Beispiele und Aspekte beschrankt, sondern ebenso in ei- 
ner Vielzahl von Abwandlungen mdglich, die im Rahmen fachge- 
maflen Handelns liegen. 
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Patentansprtiche 

1. Spracherkenner mit einem gespeicherten Vokabular von zu 
erkennenden WSrtern zur Sprachsteuerung einer Mehrzahl von 
Programmen und/oder sonstigen Dateien, denen jeweils ein Wort 
des Vokabulars als Name zugeordnet ist, 
dadurch gekennzeichnet, daft 
in einem Datei verzeichnis zu jedem Programm bzw. jeder Datei 
em Lank gespeichert ist, wobei die Namen der Links ein ers- 
tes aktives Teilvokabular des Spracherkenners bilden. 

2. Spracherkenner nach Anspruch 1, 
dadurch gekennzeichnet, daB 

die Namen der Links durch Sprachbefehle gebildet sind und die 
Lxnks Verknapfungen zu Applikationsprogrammen definieren. 

3. Spracherkenner nach Anspruch 1, 

dadurch gekennzeichnet, daB 

Lin k !TV e V ±nkS dUrCh S P rachbefehle ^bildet sind. und die 
Links Verknapfungen zu Dokumenten, insbesondere Textdokumen- 
ten oder Sprach-, Musik- oder Videodateien, definieren 



4. 

d a 



Spracherkenner nach einem der vorangehenden Anspruche 
durch gekennzeichnet, daB 
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= - ~ - « « <. « a c n n e t, daB 

mind! a r iVer2eiChnlS einE Mehr " hl V ° n anter " e "eichntssan in 
2 H T Unter ^ord„aten Hierarehieebene umraBt, wo- 

bez dze N amen der Unterverzeiehnisse zusammen mit denen der 
Links em erstes und gegebenenfails weitere, hierarehisch un 
tergeordnete active Teiivo.abulare des Spracber Jnezs 



5. Spracherkenner nach Anspruch 4, 

e t, daB 



dadurch gekennzeichn 



Jedem Program bz w . 3 eder Datei aus einem Unterverzeichnia 
e n zusammenhangender, mehrgliedriger Sprachbezehl zugeordnet 
»t. der dxe Namen der zu dam Program™ bzw. der Datei rahren- 
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den Links des Dateiverzeichnisses und jedes nachgeordneten 
Unterverzeichnisses umfaBt. 

6. Betriebsverfahren eines Spracherkenners nach einem der 
vorangehenden Anspriiche, 

dadurch gekennzeichnet, daB 
beim Start des Spracherkennerprogramms das aktuelle Vokabular 
erzeugt wird, welches wenigstens die Namen der Links des Da- 
teiverzeichnisses umfaBt. 

7. Betriebsverfahren nach Anspruch 6, 
dadurch gekennzeichnet, daB 

die Administrierung des Vokabulars als Verwaltung des Datei- 
verzeichnisses und optional vorhandener Unterverzeichnisse, 
ohne zusatzliches Vokabular-Verwaltungsprogramm, erfolgt. 

8. Betriebsverfahren nach Anspruch 6 oder 7, 
dadurch gekennzeichnet, daB 

zur Editierung zusammenhangender, . mehrgliedriger Sprachbefeh- 
le unter dem Dateiverzeichnis Unterverzeichnisse in minde- 
stens einer untergeordneten Hierarchieebene angelegt werden 
und die Erkennung zusammenhangender, mehrgliedriger Sprachbe- 
fehle in einem mehrstufigen Erkennungsvorgang erfolgt, in 
dessen Ablauf von einem ersten in ein zweite's und gegebenen- 
falls weitere aktive Teilvokabulare gewechselt wird. 

9. Betriebsverfahren nach einem der Anspriiche 6 bis 8, 
dadurch gekennzeichnet, daB 

die Aufnahme neuer Worte in das Vokabular oder die Entfernung 
von Worten aus dem Vokabular durch einen Prograrnmauf ruf ttber 
ein an sich bekanntes Kontextmenu far das betreffende Pro- 
gramm bzw. die betreffende Datei oder durch einen 
"drag' n' drop" -Ablauf erfolgt. 



Zusamraenf assung ' 
Spracherkenner und Betriebsverfahren fur einen solchen 

Spracherkenner mit einem gespeicherten Vokabular von zu er 
kennenden Wortern zur Sprachsteuerung einer Mehrzahl von Pro- 
grammen und/oder sonstigen Dateien, denen jeweils ein Wort 
des Vokabulars als Name zugeordnet ist, wobei in einem Datei- 
verzeichnis zu jedem Programm bzw. jeder Datei ein Link ge- 
spexchert ist, wobei die Namen der Links ein erstes aktives 
Teilvokabular des Spracherkenners bilden. 



